# chardet这个第三方库正好就派上了用场。用它来检测编码，简单易用。
import chardet

# 当我们拿到一个bytes时，就可以对其检测编码。用chardet检测编码，只需要一行代码：

print(chardet.detect(b'Hello, world!'))
# 检测GBK编码的中文：
data = '我是中国人'.encode('gbk')
# confidence字段，表示检测的概率,是1.0（即100%）。
print(chardet.detect(data))
# 日文进行检测：
data2 = '最新の主要ニュース'.encode('euc-jp')
print(chardet.detect(data2))
